# -*- coding: utf-8 -*-
# 1 导包 pandas、numpy
import pandas as pd
import numpy as np


# 2 定义数据预处理方法（data_preprocessing）
def data_preprocessing(file_path):
    """
    对file_path中的文件数据进行预处理
    :param file_path: 文件路径
    :return:
    """
    # 2-1 加载数据源
    data = pd.read_csv(file_path)
    # 2-2 时间格式化，转化为”%Y-%m-%d %H:%M:%S”格式
    data['time'] = pd.to_datetime(data['time']).dt.strftime("%Y-%m-%d %H:%M:%S")
    # 2-3 按照时间升序排序
    data.sort_values(by='time', ascending=True, inplace=True)
    # 2-4 去重
    data.drop_duplicates(inplace=True)
    return data
